Index Anlegen
Anlegen und Verwalten eines Index
Neuer Index anlegen
Um einen neuen Index anzulegen, klicken Sie auf den "+ Erstellen"-Button in der Indexverwaltung. Ein mehrstufiges Popup-Fenster wird geöffnet, das Sie durch den Prozess führt. Im Folgenden werden die einzelnen Schritte und die auszufüllenden Eigenschaften beschrieben.
Erste Seite: Index
Auf der ersten Seite "Index" geben Sie die grundlegenden Informationen und Einstellungen für den neuen Index ein.
-
Name (intern): Der interne Name darf nur Kleinbuchstaben, Zahlen, Bindestriche und Unterstriche enthalten und muss mit einem Buchstaben beginnen.
-
Anzeigename: Der Name, der in der Kontextanzeige verwendet wird.
-
Beschreibung: Eine kurze Beschreibung des Index.
-
Größe der Chunks:
- Jedes Dokument wird in Abschnitte (Chunks) eingeteilt. Jeder Abschnitt hat dabei eine maximale Anzahl an Wörtern.
- Empfohlene Werte: 200 bis 400. Wörter.
- Hinweis 1): Je größer der Chunk, desto mehr Kontext hat die KI, um den Ausschnitt des Dokumentes zu verstehen. Allerdings kann die KI dadurch gewisse Details übersehen. Zudem steigt der Preis für die Nutzung des Assistenten, da mehr Text verarbeitet wird.
- Hinweis 2) Beachten Sie die Tokenlimits des Sprachmodells, welches bei Ihnen hinterlegt ist. Sie können mit ca 2,5 Tokens pro Wort rechnen. Die Tokenlimits finden Sie bei Ihrem Modellanbieter, z.B. OpenAI oder Anthropic. Die Anzahl an Tokens (Anzahl Dokumente * Anzahl Tokens) darf die Limits nicht überschreiten! Zudem sollten Sie, je nach erwarteter Antwort, 1.000 bis 5.000 Token, übrig lassen.
-
Anzahl der Dokumente pro Abruf:
- Ähnlich wie bei der Größe der Chunks: Je mehr Dokumente pro Abruf, desto weniger Details werden erfasst, aber es besteht eine größere Chance, den richtigen Text zu finden, um eine Frage zu beantworten.
- Optimale Größe sind hier 3 - 7 Dokumente.
-
Completion Modell
- Für jeden Index muss ein Completion Modell ausgewählt werden. Aktuell unterstützt sind Azure OpenAi, OpenAi und Mistral. Sollte kein Modell zur Auswahl stehen, muss zunächst ein Modell mit zugehörigem Api-Schlüssel angelegt werden. Wenden Sie sich hierfür an ihren Modelladministrator.
-
System Prompt Template:
- Hier kann die KI zusätzliche Anweisungen erhalten. Beispiele und Details werden im Kapitel System Prompt Template beschrieben, es können jedoch die voreingestellten Anweisungen genutzt werden.
-
Typ: Soll der Index außerhalb der Organisation erreichbar sein?
-
Modus: Hier können Sie auswählen, in welchem Modus der Chat verfügbar ist:
- Default: Es kann genau eine Frage gestellt werden, welche beantwortet wird. Bei einer erneuten Eingabe wird der Chat zurückgesetzt und neue Quellen gesucht.
- Chat: Der Nutzer hat die Möglichkeit Rückfragen zu stellen, sowohl zur Antwort wie auch zu den bereits existierenden Quellen.
- Microworker (beta): Diese Funktion ist noch in Entwicklung und kann noch nicht stabil genutzt werden. Bitte nur in Rücksprache mit uns verwenden.
-
(Optional Embedding Modell)
- Sollten Vector Embeddings für Ihre Organisation freigeschaltet sein und Sie die Auswahlbox Hybrid Search mit Vector-Embeddings aktivieren aktiviert haben, müssen sie ein Embedding Modell auswählen. Sollte kein Modell zur Auswahl stehen, muss zunächst ein Modell mit zugehörigem Api-Schlüssel angelegt werden. Wenden Sie sich hierfür an ihren Modelladministrator.
- In Kontextauswahl ausblenden
- Anhaken dieser Einstellung ermöglicht es, zunächst einen Index mit allen Daten zu versehen, bevor Nutzer die Option haben, diesen im Chat-Bereich als Kontext auszuwählen.
Nachdem Sie alle Felder ausgefüllt haben, klicken Sie auf "Weiter".
Zweite Seite: Metadaten definieren
Auf der zweiten Seite können Sie Metadaten-Felder definieren, die später zu den Dokumenten hinzugefügt werden können. Sie können hierbei beliebig viele Metadaten-Felder hinzufügen und wieder entfernen. Diese Felder benötigen:
-
ID: Eine eindeutige Kennung für das Metadatenfeld.
-
Anzeigename: Der Name, der in der Benutzeroberfläche angezeigt wird.
-
Optional: Ob das Hochladen des Dokumentes mit oder ohne das Feld geschehen kann.
-
Bei Quellenangabe einblenden: Ob das Metadatenfeld bei der Quellenanzeige im Chat erscheinen soll.
Klicken Sie nach dem Definieren der Metadatenfelder auf "Weiter".
Dritte Seite: Zu Abonnement hinzufügen
Auf der dritten Seite können Sie den Index einem bestehenden Abonnement zuordnen.
- Abonnement auswählen:
- Wählen Sie das Abonnement aus, dem der neue Index hinzugefügt werden soll.
Klicken Sie nach der Auswahl des Abonnements auf "Weiter".
Vierte Seite: Benutzer hinzufügen
Auf der vierten Seite können Sie Benutzer dem Index hinzufügen.
- Benutzer auswählen:
- Fügen Sie die Benutzer hinzu, die Zugriff auf den Index haben sollen.
Nachdem Sie die Benutzer hinzugefügt haben, klicken Sie auf "Benutzer hinzufügen", um den neuen Index anzulegen.
Zusammenfassung
Die Anlegung eines neuen Index in der Knowledge Foundation erfolgt in einem mehrstufigen Prozess, der es Ihnen ermöglicht, detaillierte Einstellungen vorzunehmen und den Index optimal zu konfigurieren. Durch das Ausfüllen der verschiedenen Felder und die Zuweisung von Metadaten, Abonnements und Benutzern stellen Sie sicher, dass der Index den spezifischen Anforderungen Ihrer Organisation entspricht.
Im nächsten Abschnitt wird die Dokumentenverwaltung beschrieben.